カテゴリ
  1. トップ
  2. 書籍
  3. Apache Spark徹底入門
商品詳細画像

Apache Spark徹底入門

Jules S.Damji/〔ほか〕著 長谷川亮/〔ほか〕訳
著作者
Jules S.Damji/〔ほか〕著 長谷川亮/〔ほか〕訳
メーカー名/出版社名
翔泳社
出版年月
2024年4月
ISBNコード
978-4-7981-8228-5
(4-7981-8228-1)
頁数・縦
447P 23cm
分類
コンピュータ/データベース /データ分析
出荷の目安
5~10営業日前後で発送いたします。
お受け取りいただける日はお届けする国・量・時期により多少前後します。

価格¥4,000

出版社の商品紹介

出版社からのコメント

Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、mlflow、delta lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびdelta lakeを使いこなすための解説を行います。本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書での学習を通じて、次のことが学習できます。・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習・Spark の操作とSQLエンジンの理解・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化・[日本語版オリジナルコンテンツ]pandas dataframe、spark dataframeに関する各種データフレームの使い分け ・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践※本書は『Learning Spark: Lightning−Fast Data Anarytics 2nd Edition』の邦訳です。

  • ※商品代の他に送料がかかります。
    送料は商品代・送付先によって変わります。詳しくは書籍の料金についてのご案内をご確認ください。
  • ※現時点でお取り扱いがない場合でも、今後購入可能となる場合がございます。
  • ※送付先を追加・変更される場合はご購入前にマイページよりご登録をお願いいたします。
  • ※商品は予告なく取り扱い中止となる場合がございます。
  • ※ご注文商品が在庫切れなどの際はキャンセルのご連絡をさせていただく場合がございます。
common-popup-caution

common-popup-caution